十一项冠军!来看看中国科大这个团队在语音和图文识别领域有多牛
近年来,伴随着人工智能的快速发展,以语音识别、光学字符识别和目标识别与检测等为核心的多模态学习受到广泛关注,被认为是未来能够最早被广泛应用的技术领域之一。中国自动化学会模式识别与机器智能专委会委员、中国科学技术大学杜俊副教授带领的团队,在最近的语音和图文识别等国际评测和竞赛中荣获十一项冠军,其中包括:
2018年第五届国际多通道语音分离和识别大赛(CHiME-5)全部四项冠军(语音识别)
第16届国际手写识别前沿会议(ICFHR)东南亚棕榈叶手稿分析两项冠军(手写识别)
第24届2018年国际模式识别大会(ICPR)多样式网络图像识别与检测挑战赛全部三项冠军(光学字符识别)
ICPR遥感图像目标检测全部两项冠军
展现了国际领先的研究实力!
01
北京时间2018年9月7日,国际多通道语音分离和识别大赛(CHiME)组委会宣布中国科学技术大学杜俊副教授带领的中科大和科大讯飞联合团队包揽了最新一届CHiME-5赛事全部四个项目的冠军。这是继2016年的CHiME-4后,该团队再次在该赛事所有项目上问鼎。
CHiME (Computational Hearing in Multisource Environments) 属于国际语音识别评测中的高难度比赛,是目前业界影响力最大、参赛队伍最多、水平最高的多通道噪声鲁棒性语音识别比赛。经过对比赛任务的深入分析,中国科学技术大学杜俊副教授及其学生高天、孙磊等、科大讯飞研究院、西北工业大学陈景东教授,以及佐治亚理工学院李锦辉教授等国内外知名专家携手制定了有效的解决方案。最终在单麦克风阵列任务、分布式麦克风阵列任务(Rank A)和两种麦克风阵列对应的两个端到端的语音识别任务(Rank B),共计四项任务中连续两届包揽所有项目冠军,再次大幅刷新各项目的最好成绩。
02
北京时间2018年8月5-8日,第16届国际手写识别前沿会议International Conference on Frontiers in Handwriting Recognition (ICFHR 2018) 在美国纽约州尼尔加拉成功举办。在该会议的东南亚棕榈叶手稿分析的全部四项比赛中,杜俊副教授及其学生张建树、汪子锐等,搭建了基于深度学习的系统模型,在字符识别和文本音译两个任务中获得了非常好的性能,且均以明显优势取得了第一名的好成绩。
ICFHR 2018 Competition On Document Image Analysis Tasks for Southeast Asian Palm Leaf Manuscripts任务三冠军获奖证书
ICFHR 2018 Competition On Document Image Analysis Tasks for Southeast Asian Palm Leaf Manuscripts任务四冠军获奖证书
03
北京时间2018年8月20号,在第24届国际模式识别大会 (ICPR 2018) 上,竞赛组委会宣布中科大语音及语言国家工程实验室与科大讯飞联合团队nelslip (iflytek&ustc),包揽了全部三项任务的冠军。
MTWI (Multi-Type Web Images,多样式网络图像) 识别挑战赛由模式识别领域的国际盛会ICPR和阿里巴巴联合举办,吸引了三星中国研究院、商汤科技、网易、清华大学、北京大学、中科院等众多产业界和学术界的著名研究机构参与。此次比赛共分为三个子任务:1、文本行识别,要求参赛者识别出给定的文本行图像中的文字;2、文本检测,要求参赛者在给定的网络图像中检测出文本行所在的位置;3、端到端文本检测和识别,则需要同时对文本行进行检测并识别。针对此次比赛,杜俊副教授及其学生张建树、朱意星等首次提出基于汉字偏旁部首的识别模型,大幅提升识别性能并包揽了该竞赛全部三项冠军。
ICPR MTWI 2018任务一冠军获奖证书
ICPR MTWI 2018任务二冠军获奖证书
ICPR MTWI 2018任务三冠军获奖证书
04
同时,ICPR MTWI竞赛中的检测方案同样被用于ICPR的遥感图像目标检测竞赛中,且以很明显的优势获得了遥感检测比赛的全部两项冠军。在遥感检测中获得冠军更充分说明了该检测算法的普适性和实用性。
ICPR2018遥感图像目标检测任务一冠军获奖证书
ICPR2018遥感图像目标检测任务二冠军获奖证书
来源:信息科学技术学院
相关阅读